原文

这是由一位长期从事科技新闻记者 Michael Copeland 关于解释深度学习的基本原理系列文章的第一部分。

人工智能就是未来,像是科幻小说。人工智能已经是我们日常生活中的一部分。以上这些陈述都是真的,当然这都取决于你所说的是什么意义上的人工智能。

例如,当 Google 深度学习程序 AlphaGo 在今年年初的全球大赛上打败了韩国围棋大师 Lee (李世乭——译者注), 人工智能、机器学习以及深度学习都被用于多媒体来描述深度学习是如何赢下比赛的。并且这三部分也解释了为什么 AlphaGo 彻底打败了李世乭。但它们并不是一回事。

思考它们之间关系最简单的方式就是把它们都设想为一个同心圆。AI —— 最大的那个圆,机器学习次之,最后才是如今驱动人工智能迅速发展的深度学习。

由萧条到繁荣

人工智能已经是因为一小部分计算机科学家们聚集在举办于 1956 年的达特茅斯学术会议上并由此诞生了人工智能领域。在后来的几十年里,人工智能已经接二连三的被视作我们文明光明未来的钥匙,然而却因为一些粗鄙的观点而被扔到技术垃圾堆里。坦率的讲,直到 2012 年它才算是新生。

在过去的一些年里,尤其是从 2015 年开始人工智能已经开始爆发式发展了。它们大部分都和 GPU 的性能有关,以此以更加廉价、强大、快速的提升并行计算能力。它也和同时连续操作近乎无限存储以及大批量各种格式的数据 —— 图片、文本、数据处理、遍历数据、只要是你能说的上来的格式有关。

我们现在来过一下计算机科学家是如何从 2012 年开始将一个非常萧条的能够解放应用于亿万人应用的事物一步步推向繁盛。

人工智能 —— 由机器来展示人类的智慧


注: 那些下棋的计算机程序都是早期人工智能的案例,在二十世纪五十年代就引发了轰动。

回到 1956 年夏天的那个会议,那些满怀梦想的 AI 先驱门打算用当时的电脑做一个能够和人类拥有相同智力特性的复杂机器。 这也是我们所普遍认为的 AI 的概念 —— 拥有我们所有感官(甚至更多)以及像我们一样能够思考的极好的机器。你已经在很多电影里看到类似于我们的朋友 —— “C-3PO”、敌人——终结者。AI 机器已经以非常合理的缘由普遍的出现在电影、科幻小说里。我们目前还无法达成、但至少目前是。

我们目前所能投身到 “狭义上的 AI” 技术上的仅仅是让一些具体的任务做的比我们人类更好一些。狭义 AI 的例子如像 Pinterest、Facebook 的人脸识别类似的图片的分类服务。

这些都是实践中的狭义 AI。这些技术已经展现出人类的部分智力特性了。然而? 这些智能源自哪里呢?让我们来到下一个圆——机器学习。

机器学习 —— 实现人工智能的一个途径


干掉垃圾邮件:机器学习可以让你的邮箱在相对程度上避免垃圾邮件的骚扰

机器学习 基本上就是利用算法来锻炼它分析数据,并不断学习,然后预测或决定世界上将来要发生的事。而非手动去写一些常规的程序来完成一些特定的任务,机器就这样使用大量的数据来被训练并且对应的算法给予了它做任务的能力。

机器学习直接启蒙于早期 AI 人群的思想。含有决策树学习的算法在这些年里才慢慢出现,其中有归纳逻辑编程。集群、强化学习和贝叶斯网络等。众所周知,没有人能够实现终极 AI,甚至狭义上的 AI 都主要是一些早期 AI 的学习方法。

原来,多年以来机器学习最好的应用领域之一就是计算机视觉,即使它仍然需要大量的手写代码来更好地完成任务。人们可能参与并手写一些类似于边界条件检测器来让程序能够检测一个对象的起点和终点;形状检测器来检测它是否拥有八条边;一个分级器可以识别 “S-T-O-P” 这样的字符串。通过这些手写的代码分级器它们可以开发出能够识别一张图片并且 “学习” 去决策它是否是一个停止记号。

很棒,但依旧令人费解。尤其是在雾天当一个信号完全看不见时,或者一棵树挡住了信号的一部分时。这也是计算机视觉和图像识别没有能够接近甚至看齐人类的原因,它太脆弱且容易出错。

时间和正确的学习算法可以改变了一切。

深度学习 —— 实现机器学习的一种技术


一群猫:从 YouTube 视频中捕获猫的图片是深度学习的一个突破性展示。

另外一种源自早期机器学习的算法,人工神经网络出现于过去的几十年里。神经网络的灵感来源于我们对自己大脑生理的理解 —— 神经元之间的连接。但是,又不像我生理大脑中任意神经元都可以在一定距离上连接到其他神经元,这些人造神经网络有相互分离的层级、连接以及数据传输的方向。

你可以拍一张照片,然后将它剪切为一系列的碎片然后将它们输入到神经网络的第一层。在第一层的人工神经元里,数据将会被传递到第二层。第二层的神经元将会做对应的任务,以此类推,直到最后一层并输出结果。

每一个神经元都会对所输入的内容分配权重 —— 其大小于任务被执行的结果有关。最终的输出结果取决于这些权重的总和。现在回想一下我们前面提到的终止标记,终止标记图片的属性就是切碎它并由神经元来检测是否是八边形、消防大红色、特定的字母或者说是交通标记的大小等。神经网络的任务就是去完成它是否是一个停止标记。它提出了一个非常学术性的基于权重的概念—— “概率向量”。在我们的案例中,系统有 86% 的信心认为它是一个停止标记,7% 的把握认为它是一个限速标记,5% 的把握认为它是一个挂在树上的风筝等等。网络建筑学可以告诉神经网络它是对的还是错的。

甚至这个例子本身就非常超前,因为直到现在的神经网络的水平,它依旧为 AI 研究社区的一道难题。这个问题甚至在 AI 早期就已经困扰他们了,甚至在智能方向停滞不前。问题即使甚至最基础的神经玩过都是非常高密集的运算,它甚至都不是一个可行的方案。 目前,在多伦多大学由 Geoffrey Hinton 组织的一个小团队一直在坚持做,最终在超级计算机上并行运行了一些列算法来证明这些概念,但直到 GPU 部署后那些实验才成功。

如果我们再次回到停止标记那个例子中,神经网络被训练的越来越协调虽然它得出了一些错误的答案,这也是一些很好的契机。它需要的是训练,它需要的是看到成千上万,甚至百万的图片直到神经元的输入变得更加协调以至于每次都能够得出正确的答案 —— 是否有雾、晴天或雨天。就是在这种情况下,神经网络教会自己停止标记是什么样子;或者 Facebook 你妈妈的面孔;或者一只猫(吴恩达 2012 年在 Google 做的一个实验)

吴恩达的突破性进展就是做出了这些神经网络,并且做的非常大,升级了每一层和对应的神经元,然后通过这个系统运行巨量的数据来训练它。在和这个例子中,从 YouTube 上获取到了 一千万张图片。吴恩达深度研究了这些能够描述每一层神经网络的深度学习。

今天,机器的通过深度学习的图片识别技术在一些复杂的情景下已经比人类做的更好了,并且能够从猫识别到血液里的癌细胞标记以及 MRI 扫描到的肿瘤。Google 的 AlphaGo 通过不断的与自己下棋来调节它的神经网络。

多亏了深度学习,人工智能拥有一个光明的未来

深度学习 已经能够通过 AI 领域额外的东西做出一些可实用的应用。深度学习能够为各种各样的机器提供辅助作用,譬如无人驾驶汽车, 更好的医疗护理,甚至更好的影片推荐,都将会实现。AI 就是现在甚至未来。有了深度学习的帮助,AI 甚至能够达到科幻小说的那种我们期望已久的状态。你也有一个 C-3PO,你也可以有你的终结者。

donation